#Janeiro 2019
planilha <- read_delim("planilha_201901.csv",
    delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 623580 Columns: 23
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (22): data_base, uf, tcb, sr, cliente, ocupacao, cnae_secao, cnae_subcla...
## num  (1): carteira_ativa
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(planilha)
## # A tibble: 6 × 23
##   data_…¹ uf    tcb   sr    cliente ocupa…² cnae_…³ cnae_…⁴ porte modal…⁵ origem
##   <chr>   <chr> <chr> <chr> <chr>   <chr>   <chr>   <chr>   <chr> <chr>   <chr> 
## 1 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - C… Sem d…
## 2 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - C… Sem d…
## 3 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - E… Sem d…
## 4 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - E… Sem d…
## 5 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - E… Sem d…
## 6 31/01/… AC    Banc… S1    PF      PF - A… -       -       PF -… PF - E… Sem d…
## # … with 12 more variables: indexador <chr>, numero_de_operacoes <chr>,
## #   a_vencer_ate_90_dias <chr>, a_vencer_de_91_ate_360_dias <chr>,
## #   a_vencer_de_361_ate_1080_dias <chr>, a_vencer_de_1081_ate_1800_dias <chr>,
## #   a_vencer_de_1801_ate_5400_dias <chr>, a_vencer_acima_de_5400_dias <chr>,
## #   vencido_acima_de_15_dias <chr>, carteira_ativa <dbl>,
## #   carteira_inadimplida_arrastada <chr>, ativo_problematico <chr>, and
## #   abbreviated variable names ¹​data_base, ²​ocupacao, ³​cnae_secao, …
attach(planilha)

#Substituindo os valores "<=15" da coluna numero_de_operacoes para 15
planilha$numero_de_operacoes <- trimws(planilha$numero_de_operacoes, "both")
planilha$numero_de_operacoes[planilha$numero_de_operacoes == "<= 15"] <- 15

#convertendo para numérico a coluna numero_de_operacoes
planilha$numero_de_operacoes <- as.numeric(planilha$numero_de_operacoes)

# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "uf"
medias_uf <- aggregate(numero_de_operacoes ~ uf, planilha, mean, na.rm = TRUE)

plot_ly(medias_uf, x = ~uf, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por UF", margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "tcb"
medias_tcb <- aggregate(numero_de_operacoes ~ tcb, planilha, mean, na.rm = TRUE)

plot_ly(medias_tcb, x = ~tcb, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por TCB", xaxis = list(title = "TCB"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "ocupacao"
medias_ocupacao <- aggregate(numero_de_operacoes ~ ocupacao, planilha, mean, na.rm = TRUE)

plot_ly(medias_ocupacao, x = ~ocupacao, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por ocupação", margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "cnae_secao"
medias_cnae_secao <- aggregate(numero_de_operacoes ~ cnae_secao, planilha, mean, na.rm = TRUE)

plot_ly(medias_cnae_secao, x = ~cnae_secao, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por CNAE seção", xaxis = list(title = "CNAE seção"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "cnae_subclasse"
medias_cnae_subclasse <- aggregate(numero_de_operacoes ~ cnae_subclasse, planilha, mean, na.rm = TRUE)

plot_ly(medias_cnae_subclasse, x = ~cnae_subclasse, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por CNAE subclasse", xaxis = list(title = "CNAE subclasse"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "porte"
medias_porte <- aggregate(numero_de_operacoes ~ porte, planilha, mean, na.rm = TRUE)

plot_ly(medias_porte, x = ~porte, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por porte", xaxis = list(title = "Porte"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "modalidade"
medias_modalidade <- aggregate(numero_de_operacoes ~ modalidade, planilha, mean, na.rm = TRUE)

plot_ly(medias_modalidade, x = ~modalidade, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por modalidade", xaxis = list(title = "Modalidade"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "indexador"
medias_indexador <- aggregate(numero_de_operacoes ~ indexador, planilha, mean, na.rm = TRUE)

plot_ly(medias_indexador, x = ~indexador, y = ~numero_de_operacoes, type = "bar") %>%
  layout(title = "Média de número de operações por indexador", xaxis = list(title = "Indexador"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Template para a leitura dos arquivos csv para o banco geral
Ano1 <- c(paste0(2019,0,1:9),paste0(2019,10:12))

Ano2 <- c(paste0(2020,0,1:9),paste0(2020,10:12))

Ano3 <- c(paste0(2021,0,1:9),paste0(2021,10:12))

Ano4 <- c(paste0(2022,0,1:9),paste0(2022,10:12))

BancoGeral <-c(Ano1, Ano2, Ano3, Ano4)

# Criação de matrizes vazias com dimensão lenght(BancoGeral) x 27(número de estados))
matriz_medias_uf_operacoes <- matrix(NA, nrow = length(BancoGeral), ncol = 27,
                                     dimnames = list(BancoGeral, NULL))

# Loop for com interações por uf
for (j in 1:length(BancoGeral)) {
  End <- paste0("planilha_", BancoGeral[j], ".csv")
  planilha <- read_delim(End, delim = ";", escape_double = FALSE, trim_ws = TRUE, show_col_types = FALSE)

  # Substituindo os valores "<=15" da coluna numero_de_operacoes para 15
  planilha$numero_de_operacoes <- trimws(planilha$numero_de_operacoes, "both")
  planilha$numero_de_operacoes[planilha$numero_de_operacoes == "<= 15"] <- 15

  # Convertendo para numérico a coluna numero_de_operacoes
  planilha$numero_de_operacoes <- as.numeric(planilha$numero_de_operacoes)

  # Calculando a média da coluna numero_de_operacoes por uf
  media_uf_operacoes <- tapply(planilha$numero_de_operacoes, planilha$uf, mean)

  # Armazenando as médias na matriz de médias de operações por uf
  matriz_medias_uf_operacoes[j, ] <- sapply(unique(planilha$uf), function(estado) {
    replace(media_uf_operacoes[estado], is.na(media_uf_operacoes[estado]), 0)})

}

# Atribuindo os nomes dos estados às colunas da matriz
colnames(matriz_medias_uf_operacoes) <- unique(planilha$uf)
# Criar objeto ts
matriz_medias_uf_operacoes_ts <- ts(matriz_medias_uf_operacoes, start = c(2019, 1), frequency = 12)

# Definir rótulos das linhas
dimnames(matriz_medias_uf_operacoes_ts)[[1]] <- BancoGeral

# Autoplot
autoplot(matriz_medias_uf_operacoes_ts)

# Estatística descritiva básica
stat.desc(matriz_medias_uf_operacoes_ts)
##                        AC           AL             AM            AP
## nbr.val        48.0000000    48.000000    48.00000000   48.00000000
## nbr.null        0.0000000     0.000000     0.00000000    0.00000000
## nbr.na          0.0000000     0.000000     0.00000000    0.00000000
## min           165.5928537   502.285356   346.83220876  180.98481522
## max           194.1553306   588.985872   439.00877785  224.45054612
## range          28.5624768    86.700515    92.17656909   43.46573090
## sum          8538.0441112 25979.752199 19015.12132457 9753.18183507
## median        179.7556737   545.579018   403.10222426  207.58883315
## mean          177.8759190   541.244837   396.14836093  203.19128823
## SE.mean         1.2524918     3.848600     3.71897155    1.73096247
## CI.mean.0.95    2.5196884     7.742385     7.48160573    3.48224732
## var            75.2993089   710.962787   663.87596910  143.81909083
## std.dev         8.6775174    26.663885    25.76579067   11.99245975
## coef.var        0.0487841     0.049264     0.06504076    0.05902054
##                          BA             CE             DF             ES
## nbr.val         48.00000000    48.00000000    48.00000000    48.00000000
## nbr.null         0.00000000     0.00000000     0.00000000     0.00000000
## nbr.na           0.00000000     0.00000000     0.00000000     0.00000000
## min            801.88714690   690.70712571   404.22308130   268.86689338
## max            994.96755653   907.91830573   507.28238621   358.87963120
## range          193.08040963   217.21118002   103.05930491    90.01273782
## sum          42390.75950062 37853.87021502 21124.84514091 14793.65165536
## median         889.66669998   778.17106581   442.14245980   309.69449144
## mean           883.14082293   788.62229615   440.10094044   308.20107615
## SE.mean          8.15338294     7.14965633     3.64146559     2.99422014
## CI.mean.0.95    16.40249079    14.38325330     7.32568386     6.02359397
## var           3190.92736541  2453.64411012   636.49303980   430.33700528
## std.dev         56.48829406    49.53427208    25.22881368    20.74456568
## coef.var         0.06396295     0.06281115     0.05732506     0.06730854
##                          GO            MA             MG             MS
## nbr.val         48.00000000    48.0000000    48.00000000    48.00000000
## nbr.null         0.00000000     0.0000000     0.00000000     0.00000000
## nbr.na           0.00000000     0.0000000     0.00000000     0.00000000
## min            351.94063646   537.7772266   696.47560203   250.43445952
## max            433.91530115   667.3256682   864.83591649   288.47288783
## range           81.97466470   129.5484416   168.36031445    38.03842831
## sum          18289.07537219 29126.2732869 36214.74537020 12944.71153620
## median         380.79997634   614.6289893   758.68905525   269.56259525
## mean           381.02240359   606.7973601   754.47386188   269.68149034
## SE.mean          3.16751588     5.6883743     6.10983124     1.67500319
## CI.mean.0.95     6.37222002    11.4435330    12.29139504     3.36967178
## var            481.59152791  1553.1648858  1791.84181379   134.67051333
## std.dev         21.94519373    39.4102130    42.33015254    11.60476253
## coef.var         0.05759555     0.0649479     0.05610553     0.04303136
##                          MT             PA             PB             PE
## nbr.val         48.00000000    48.00000000    48.00000000    48.00000000
## nbr.null         0.00000000     0.00000000     0.00000000     0.00000000
## nbr.na           0.00000000     0.00000000     0.00000000     0.00000000
## min            207.34331091   459.72808419   501.62127014   719.38436864
## max            249.89487878   559.65093661   610.01593775   894.73904296
## range           42.55156787    99.92285243   108.39466762   175.35467432
## sum          10790.05781492 24534.18497286 26073.30985882 38556.24219462
## median         225.38056069   519.62185539   549.53995033   808.38546820
## mean           224.79287114   511.12885360   543.19395539   803.25504572
## SE.mean          1.81071246     4.75750140     4.11379309     6.63515399
## CI.mean.0.95     3.64268362     9.57085831     8.27588423    13.34820810
## var            157.37662162  1086.42333852   812.31809317  2113.21288838
## std.dev         12.54498392    32.96093655    28.50119459    45.96969533
## coef.var         0.05580686     0.06448655     0.05246965     0.05722926
##                          PI             PR             RJ             RN
## nbr.val         48.00000000    48.00000000    48.00000000    48.00000000
## nbr.null         0.00000000     0.00000000     0.00000000     0.00000000
## nbr.na           0.00000000     0.00000000     0.00000000     0.00000000
## min            388.51421047   410.40889594  1088.12723879   481.15397862
## max            499.37980419   495.50882482  1305.19050345   560.55303948
## range          110.86559372    85.09992888   217.06326466    79.39906086
## sum          21437.67842887 21177.35517653 57844.21961228 24595.22098904
## median         453.22507342   441.45654129  1219.26121053   513.12379499
## mean           446.61830060   441.19489951  1205.08790859   512.40043727
## SE.mean          4.22190570     3.06816736     9.82768021     3.36230408
## CI.mean.0.95     8.49337874     6.17235659    19.77074242     6.76408334
## var            855.57541212   451.85524626  4635.99831422   542.64425921
## std.dev         29.25022072    21.25688703    68.08816574    23.29472600
## coef.var         0.06549266     0.04818026     0.05650058     0.04546196
##                         RO            RR             RS             SC
## nbr.val        48.00000000   48.00000000    48.00000000    48.00000000
## nbr.null        0.00000000    0.00000000     0.00000000     0.00000000
## nbr.na          0.00000000    0.00000000     0.00000000     0.00000000
## min           167.04834144  161.04380390   449.90533639   276.36359992
## max           208.13440463  200.19515131   531.22713828   335.39996817
## range          41.08606319   39.15134740    81.32180189    59.03636825
## sum          8905.46802938 8494.65613610 23455.69026909 14171.48921946
## median        184.04208847  174.28056443   491.55527228   294.42246586
## mean          185.53058395  176.97200284   488.66021394   295.23935874
## SE.mean         1.73742882    1.62529213     3.25359197     1.88005000
## CI.mean.0.95    3.49525594    3.26966602     6.54538279     3.78217276
## var           144.89562695  126.79557571   508.12131504   169.66022482
## std.dev        12.03725994   11.26035416    22.54154642    13.02536851
## coef.var        0.06488019    0.06362788     0.04612929     0.04411799
##                          SE             SP            TO
## nbr.val         48.00000000    48.00000000   48.00000000
## nbr.null         0.00000000     0.00000000    0.00000000
## nbr.na           0.00000000     0.00000000    0.00000000
## min            372.27792916  1425.27915116  159.02930805
## max            448.47650048  1720.71734196  192.92095856
## range           76.19857132   295.43819080   33.89165051
## sum          19467.09808435 74211.32679033 8319.62012146
## median         412.33887687  1563.55841103  174.32520043
## mean           405.56454342  1546.06930813  173.32541920
## SE.mean          2.98934948    11.04266254    1.40058820
## CI.mean.0.95     6.01379546    22.21497161    2.81762003
## var            428.93809576  5853.13900797   94.15907075
## std.dev         20.71082074    76.50581029    9.70355969
## coef.var         0.05106665     0.04948408    0.05598463
# Convertendo para data frame
data_frame_uf_operacoes <- as.data.frame(matriz_medias_uf_operacoes)

# Adicionar coluna de período ao data frame
data_frame_uf_operacoes <- data_frame_uf_operacoes %>%
  mutate(Periodo = rep(c("Periodo1", "Periodo2", "Periodo3"), each = 16))

# Realizar o teste de Kruskal-Wallis por períodos
kruskal_test_uf_operacoes <- kruskal.test(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo)

# Imprimir os resultados
print(kruskal_test_uf_operacoes)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  data_frame_uf_operacoes$RS by data_frame_uf_operacoes$Periodo
## Kruskal-Wallis chi-squared = 26.129, df = 2, p-value = 0.000002119
# Teste de dunn
dunn_test_uf_operacoes <- dunn.test(data_frame_uf_operacoes$RS, data_frame_uf_operacoes$Periodo, method = "holm")
##   Kruskal-Wallis rank sum test
## 
## data: x and group
## Kruskal-Wallis chi-squared = 26.1295, df = 2, p-value = 0
## 
## 
##                            Comparison of x by group                            
##                                     (Holm)                                     
## Col Mean-|
## Row Mean |   Periodo1   Periodo2
## ---------+----------------------
## Periodo2 |   3.901714
##          |    0.0001*
##          |
## Periodo3 |  -0.909137  -4.810851
##          |     0.1816    0.0000*
## 
## alpha = 0.05
## Reject Ho if p <= alpha/2
# Média dos períodos - estado do Rio Grande do Sul
aggregate(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo, data = data_frame_uf_operacoes, mean)
##   data_frame_uf_operacoes$Periodo data_frame_uf_operacoes$RS
## 1                        Periodo1                   496.4444
## 2                        Periodo2                   465.0103
## 3                        Periodo3                   504.5259
# Desvio Padrão dos períodos - estado do Rio Grande do Sul
aggregate(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo, data = data_frame_uf_operacoes, sd)
##   data_frame_uf_operacoes$Periodo data_frame_uf_operacoes$RS
## 1                        Periodo1                   18.26579
## 2                        Periodo2                   11.24271
## 3                        Periodo3                   14.22434
# Criação da Matriz de médias por Cartão de Crédito PF
matriz_medias_cartao_de_credito_pf <- matrix(NA, nrow = length(BancoGeral), ncol = 10,
                                             dimnames = list(BancoGeral, NULL))

# Adicionar rótulos às colunas
colnames(matriz_medias_cartao_de_credito_pf) <- c("A vencer 90", "A vencer 91 ate 360", "A vencer 361 ate 1080",
             "A vencer 1081 ate 1800", "A Vencer 1801 ate 5400", "A vencer acima 5400",
             "Vencido acima 15", "Carteira Ativa", "Inadimplida arrastada", "Ativo problematico")

# Loop for com interações por modalidade Cartão de Crédito - PF #BancoGeral[j]
for (j in 1:length(BancoGeral)) {
  End <- paste0("planilha_", BancoGeral[j], ".csv")
  planilha <- read_delim(End, delim = ";", escape_double = FALSE, trim_ws = TRUE, show_col_types = FALSE)

  # Filtrar as linhas com modalidade igual a "PF - Cartão de Crédito"
  Names <- unique(planilha$modalidade)
  planilha_filtrada <-  filter(planilha, planilha$modalidade == Names[1])
  
  # Convertendo , em .
  planilha_filtrada <- planilha_filtrada %>% 
    mutate_at(vars(14:23), ~ gsub(",", ".", .))

  # Convertendo para numérico as colunas a vencer/vencidos e outras relevantes
  filtro <- apply(planilha_filtrada[,14:23], 2, as.numeric)
  
  # Teste calculo mean
  Mean_filtro <- apply(filtro, 2, mean)

  # Armazenar na matriz_medias_cartao_de_credito as médias do filtro
  matriz_medias_cartao_de_credito_pf[j,] <- Mean_filtro
}
# Criar objeto ts
matriz_medias_cartao_de_credito_pf_ts <- ts(matriz_medias_cartao_de_credito_pf, start = c(2019, 1), frequency = 12)

# Definir rótulos das linhas
dimnames(matriz_medias_cartao_de_credito_pf_ts)[[1]] <- BancoGeral

# Autoplot
autoplot(matriz_medias_cartao_de_credito_pf_ts)

# Estatística descritiva básica
stat.desc(matriz_medias_cartao_de_credito_pf_ts)
##                        A vencer 90  A vencer 91 ate 360 A vencer 361 ate 1080
## nbr.val                 48.0000000           48.0000000             48.000000
## nbr.null                 0.0000000            0.0000000              0.000000
## nbr.na                   0.0000000            0.0000000              0.000000
## min                8902862.8521989      3509421.0260852         230448.141375
## max               14489646.5198512      5693534.3001578         560696.992983
## range              5586783.6676523      2184113.2740726         330248.851608
## sum              560552795.6071765    213532631.5549928       20350895.823483
## median            11509664.6487708      4373258.1839946         447028.066192
## mean              11678183.2418162      4448596.4907290         423976.996323
## SE.mean             198272.3829706        88825.7401289          14394.660668
## CI.mean.0.95        398872.5855756       178694.3400794          28958.322048
## var          1886973016743.7026367 378720581253.7916260     9945900276.050253
## std.dev            1373671.3641711       615402.7796929          99729.134540
## coef.var                 0.1176271            0.1383364              0.235223
##              A vencer 1081 ate 1800 A Vencer 1801 ate 5400 A vencer acima 5400
## nbr.val                  48.0000000             48.0000000         48.00000000
## nbr.null                  0.0000000              0.0000000          0.00000000
## nbr.na                    0.0000000              0.0000000          0.00000000
## min                   13544.9335035           4919.4483823          0.06648447
## max                   93165.8578916          41307.0990237         16.11733478
## range                 79620.9243881          36387.6506414         16.05085030
## sum                 2397760.1845634         790382.1028323         59.92451278
## median                56291.1606975          14676.1935612          0.08988635
## mean                  49953.3371784          16466.2938090          1.24842735
## SE.mean                3427.3275169           1473.7770133          0.57170801
## CI.mean.0.95           6894.8936195           2964.8569259          1.15012816
## var               563835547.5844648      104256896.8784212         15.68880215
## std.dev               23745.2215737          10210.6266643          3.96090926
## coef.var                  0.4753481              0.6200926          3.17271907
##                  Vencido acima 15            Carteira Ativa
## nbr.val                48.0000000                48.0000000
## nbr.null                0.0000000                 0.0000000
## nbr.na                  0.0000000                 0.0000000
## min               1028331.3926530        1452557834.2150736
## max               2512511.5478168        2338783046.1273885
## range             1484180.1551638         886225211.9123149
## sum              73259622.1679335       87088414736.5493927
## median            1438419.5130054        1728255223.5662026
## mean              1526242.1284986        1814341973.6781125
## SE.mean             58871.0522360          33585498.6020053
## CI.mean.0.95       118433.2808690          67565308.2114684
## var          166358437985.7385559 54143314384574288.0000000
## std.dev            407870.6142709         232687159.9048265
## coef.var                0.2672385                 0.1282488
##              Inadimplida arrastada   Ativo problematico
## nbr.val                 48.0000000           48.0000000
## nbr.null                 0.0000000            0.0000000
## nbr.na                   0.0000000            0.0000000
## min                 695643.1445480      1135032.5991186
## max                1876705.3932874      2615310.6161151
## range              1181062.2487393      1480278.0169965
## sum               52637299.3816337     75475750.6574986
## median             1065516.8412173      1463291.8051043
## mean               1096610.4037840      1572411.4720312
## SE.mean              42251.5768495        55705.1854200
## CI.mean.0.95         84999.2089170       112064.3783343
## var            85689395820.7246094 148947248768.6980591
## std.dev             292727.5112126       385936.8455702
## coef.var                 0.2669385            0.2454427
# Convertendo para data frame
data_frame_cartao_de_credito_pf <- as.data.frame(matriz_medias_cartao_de_credito_pf)

# Adicionar coluna de período ao data frame
data_frame_cartao_de_credito_pf <- data_frame_cartao_de_credito_pf %>%
  mutate(Periodo = rep(c("Periodo1", "Periodo2", "Periodo3"), each = 16))

# Realizar o teste de Kruskal-Wallis por períodos
kruskal_test_cartao_de_credito_pf <- kruskal.test(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_uf_operacoes$Periodo)

# Imprimir os resultados
print(kruskal_test_cartao_de_credito_pf)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  data_frame_cartao_de_credito_pf$`Carteira Ativa` by data_frame_uf_operacoes$Periodo
## Kruskal-Wallis chi-squared = 33.004, df = 2, p-value = 0.0000000681
# Teste de dunn
dunn_test_cartao_de_credito_pf <- dunn.test(data_frame_cartao_de_credito_pf$`Carteira Ativa`, data_frame_cartao_de_credito_pf$Periodo, method = "holm")
##   Kruskal-Wallis rank sum test
## 
## data: x and group
## Kruskal-Wallis chi-squared = 33.0045, df = 2, p-value = 0
## 
## 
##                            Comparison of x by group                            
##                                     (Holm)                                     
## Col Mean-|
## Row Mean |   Periodo1   Periodo2
## ---------+----------------------
## Periodo2 |   1.464721
##          |     0.0715
##          |
## Periodo3 |  -4.078490  -5.543212
##          |    0.0000*    0.0000*
## 
## alpha = 0.05
## Reject Ho if p <= alpha/2
# Média dos períodos - operações de cartão de crédito pf
aggregate(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_cartao_de_credito_pf$Periodo, data = data_frame_cartao_de_credito_pf, mean)
##   data_frame_cartao_de_credito_pf$Periodo
## 1                                Periodo1
## 2                                Periodo2
## 3                                Periodo3
##   data_frame_cartao_de_credito_pf$`Carteira Ativa`
## 1                                       1710331780
## 2                                       1634035888
## 3                                       2098658253
# Desvio padrão dos períodos - operações de cartão de crédito pf
aggregate(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_cartao_de_credito_pf$Periodo, data = data_frame_cartao_de_credito_pf, sd)
##   data_frame_cartao_de_credito_pf$Periodo
## 1                                Periodo1
## 2                                Periodo2
## 3                                Periodo3
##   data_frame_cartao_de_credito_pf$`Carteira Ativa`
## 1                                         87102230
## 2                                        101472785
## 3                                        139009949